出品|《态度》

作者|汉雨棣

编辑|丁广胜

 对国产大模型圈来说,这个4月最大的两件事情就是DeepSeek V4和腾讯混元3.0的“同台对决”。

 23日下午,腾讯混元大模型团队领先DeepSeek半步,发布并开源了重建后的首个模型Hy3 preview。根据腾讯方面的消息,Hy3 preview为总参数量295B的混合专家模型,支持256K上下文长度,主打全面实用性,在官方发布的评测中,模型在上下文学习、复杂推理、代码与智能体等方向的表现较以往有所进步。

 在应用层面,Hy3 preview目前已在腾讯云、元宝智能体、CodeBuddy等多个腾讯内部AI产品及服务中上线。

 在成本与效率方面,官方称Hy3 preview的整体推理效率较前代提升约40%。根据官方定价,标准套餐一亿token 78元,三亿token 238元。

 更多人津津乐道的是,这是95后姚顺雨上任腾讯副总裁后的第一枪。他表示,此次开源Hy3 preview是混元大模型重建的第一步,希望通过社区反馈提升后续正式版模型的实用性,并持续探索特色模型能力。

 更多人希望通过Hy3的新模型,看看姚顺雨给腾讯带来了什么,腾讯在AI军备赛中走到了哪一步。我们对Hy3 preview的问答、文档处理、图片生成与代码能力均进行了实测。

网易科技《态度》实测:是好学生,但不算尖子生

首先,我们先进行了经典的“洗车难题”的问答。

Hy3并没有掉进坑里,而是直接指出了问题的痛点——洗车,重要的是车要到店。这一点上,Hy3的智商还是在线的。

随后,我们通过workbuddy调用了Hy3来帮我们处理财务文档。提示词:这里是腾讯前四个季度的财报,请帮我总结其中重点数据并生成一份简单的分析报告。

可以看到,模型能够直接生成可以实用的图表,经过核对,他并没有出现幻觉来编造数据,还能提供相对可靠的图表和建议。但在这一环节,4个50多页的pdf上传之后,模型使用了数分钟来进行分析和拆解,客观意义上来说这并不算快。

在文字能力之后,我们也测试了Hy3的3D生图能力。

提示词如下:帮我生成一幅3D图片,尽可能立体和真实。要求如下:一只机械改造的猎豹,处于奔跑的动态姿态。猎豹的左半身是流畅的、带有光泽的流线型碳纤维装甲,右半身则保留了逼真的生物皮毛(猎豹斑点)。机械部分露出内部的液压杆、蓝色发光电缆和精细的齿轮关节。需要精准的解剖结构,机械与生物部分的连接处过渡自然。生成高清、全角度可用的纹理。

可以看出,Hy3 Preview输出的3D模型在生物力学上表现相对合理,骨骼与液压杆的匹配度较高,且在两种截然不同材质的接缝处实现了较为自然的过渡。但显然并没有达到电影级别的3D感。

最后,我们测试了Hy3主打的代码能力。

提示词:用一个HTML代码块编写一个前端页面。帮我生成一个现代化的个人博客文章列表页面。要求包含一个带有品牌Logo和搜索框的顶部导航栏,下方是响应式的卡片布局(三列),每张卡片需展示精美的文章封面图、吸引人的标题、简短的摘要、作者头像及发布日期,整体视觉风格要简洁、专业且富有设计感。


测试结果显示,模型直接输出了一段结构清晰、命名规范的HTML/CSS代码,在直接运行之后,基本达到了可直接投入生产环境的标准。

在初步体验测试之后,综合来看,Hy3确实是一个全面、实用的模型,他可以兼顾各类基本需求,能力和智商都在线,但值得注意的是,这些任务在我们日常的工作中仍然是基础任务,在更复杂的任务、更高的要求之下,Hy3还有一定的距离。

姚顺雨的“第一枪”:腾讯依旧理性、务实

要理解姚顺雨为腾讯混元带来的改变,我们首先要剖析他给团队注入的技术新思路。

在过去很长一段时间里,大模型行业陷入了对参数规模和榜单排名的迷恋,但堆料带来的性能提升往往在实际业务场景中面临高昂的推理成本和落地难题。姚顺雨上任之后,旗帜鲜明地反对过这种病态追逐,给腾讯的技术路线带来了一股注重实效的理性风气。

从Hy3中可以看出,该模型依托其此前在推理与行动融合(ReAct)范式以及思维树(ToT)架构上的研究积累,尝试跳出了传统的“概率预测”框架,引入了模拟人类大脑机制的“快慢思考融合机制”。具体而言,这种设计旨在让模型面对日常简单查询时调用轻量化的“快思考”以保证响应速度,而在应对复杂的数学证明或代码调试时,则激活深层逻辑链路进行“慢思考”推演。

从理论上看,这种机制有助于在保持295B超大模型性能的同时控制能耗,但不可否认的是,这类快慢思考的切换在真实高并发场景下的平滑度以及实际的降本幅度,仍需经过大规模商业部署的进一步检验。

从腾讯的组织架构上看,为了支撑这种新的技术愿景,腾讯在底层组织架构上也进行了一场不动声色的“重工业升级”。为了实现姚顺雨提出的“Agentic AI”(智能体AI)目标,腾讯打破了过往的部门壁垒,专门成立了统筹底层算力调度、大规模并行训练以及高质量数据治理的Allnfra部门。

这一举措表明,腾讯的AI研发重心正试图从单纯追求对话能力的“上层建筑”,下沉到解决生产力问题的“底层基座”。通过建立万卡级并行训练集群和动态MoE切片调度系统,腾讯希望从根本上掌握大模型研发的自主权。这种务实的偏向,在混元3.0处理复杂代码逻辑和高精度3D建模时的实测表现中得到了清晰体现,反映出腾讯试图利用AI彻底重构其游戏、社交与云服务的技术底座。

当然,组织架构的整合往往伴随着阵痛期,这种集中式的基础设施建设能否灵活响应上层瞬息万变的应用需求,将是腾讯在接下来几个季度需要面对的内部管理考验。

在生态布局与技术开放性上,腾讯正展现出一种微妙的平衡艺术。一方面,腾讯正以一种近乎“饱和攻击”的态势推进全线产品的Agent化,将混元能力渗透进包括微信、腾讯会议及广告营销在内的900多款应用中。这种内生式的进化极大地提升了研发效率,甚至实现了50%的新增代码由AI辅助生成的工业级突破。另一方面,腾讯也罕见地高调拥抱开源,通过发布混元3.0的预览版本,试图利用全球开发者的反馈来反哺其逻辑推理能力的迭代。这种策略不仅是为了在激烈的开源生态中夺取话语权,更像是姚顺雨技术理念的延伸。即通过真实世界的复杂反馈,让AI智能体在实战中完成最终跨越。

所以,混元3.0 Preview的发布并没有带来那种颠覆行业的狂热感,但它能够传递出腾讯在AI赛道上的转向。

对于腾讯而言,只要不掉队,他们手中握有的场景底牌足以让任何对手不敢小觑;而对于整个行业来说,一个更加务实、注重落地且资金雄厚的腾讯正式发力,无疑将让大模型的“下半场”变得更加扑朔迷离且精彩纷呈。